楼主: jonhy
|
42726
40
[问答] [求助]采用聚类分析时,如何确定聚类的数目? |
高中生 77%
-
|
回帖推荐cowboy1106 发表于22楼 查看完整内容 确定聚类个数的方法:
相似系数:指变量或样本间的亲密程度(即阈值),相似系数较大的聚为一类。常用的有夹角余弦、相关系数、指数相似系数。
标尺值:0~25进行分类。
伪F统计量:应该取伪F统计量较大而类数较小的聚类水平。如下图所示,应该分为4类最合适。
统计量R2:应该取R2统计量较大的类数数目。
伪t2统计量:伪t2统计量大说明不应该合并这两类,应该取合并前的水平。
实际意义:根据你做得试验,必须有实际意义。比 ...
The NUMCLUSTERS subcommand specifies the number of clusters into which the data willbe partitioned.AUTO Automatic selection of the number of clusters. Under AUTO, you may specifya maximum number of possible clusters. TWOSTEP CLUSTER will search forthe best number of clusters between 1 and the maximum using the criterionthat you specify. The criterion for deciding the number of clusters can beeithe ...
sunkist123 发表于8楼 查看完整内容 本帖被以下文库推荐
| ||
| ||
| ||
| ||||||||||||||||||||
| ||
给中文世界的优质语料添砖添瓦
|
||
| ||
| ||
| ||
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明